转录组测序结果上调,而qPCR结果下调,问题出在哪儿?
转录组测序结果上调,而qPCR结果下调,问题出在哪儿?
这真是一个令人头疼的问题。然而,如果能避开以下这些坑,你的qPCR验证吻合率将大幅提高。
首先,你需要对qPCR验证吻合率有一个合理预期,这两件事必须十分清楚:
1. 测序和qPCR是两种不同的检测方法,出现一定程度的不一致(30~40%左右)是正常的也是合理的[1]。
2. 用qPCR验证测序结果,验证的是差异趋势,即上调还是下调,而非差异倍数。
下面,我们就来梳理下有哪些坑会导致qPCR结果与测序结果吻合率低。
你注意到基因和转录本的区别了吗?由于可变剪接的存在,一个基因可能存在着多条转录本,而很多时候各条转录本的差异变化趋势是不一致的(见图1)。你要确定好,qPCR验证的是基因的还是某个转录本的差异变化。如果某个基因的各条转录本差异变化不同,就很可能导致qPCR验证不出来。为便于区分和查看,在我们提供的转录组测序结果中,不仅提供基因差异表达数据,也提供了转录本差异表达数据。
图1 基因有多个转录本
实际情况多种多样,以下面3种情况为例,
1)你用了另一批(如不同时间培养或采集的)样本来做qPCR验证,即使处理条件相同;
2)测序实验检测的是混合样本,而qPCR验证时不用混合样本,而改为单独样本一个一个检测;
3)测序和qPCR检测的是不同物种的样本。如测序测的是小鼠肝组织,而qPCR验证时用的是人肝组织。
这3种情况出现验证不一致,没什么可奇怪的。因为测序结果只能对测序所对应的样本负责任。
什么?测序检测用的是血浆,你qPCR验证的时候用组织,用细胞样本来检测。验证不一致的理由同“坑二”。
假如有2个基因,基因A的表达量从对照组的1上调到实验组的10,基因B的表达量从对照组的1000上调到实验组的10000,两个基因都是10倍的差异,你觉得哪个差异变化更可靠?由于系统噪音的存在,低表达量基因的表达水平变化,可信度较低。建议选择表达水平中上的基因进行验证,并开展后续研究。
对差异不显著的基因(差异倍数<1.5),就没什么好说的,验证不出来是正常的,验证出来是幸运的。
不多说,马上和测序公司确认清楚比对关系。如果搞反了,差异变化趋势倒过来是不是就对了?当然我们也遇到过测序样本送错了的情况。好吧,这种情况我们就不做讨论了。
除了上面说到的这些,你还听(亲)说(历)过哪些可能导致qPCR验证吻合率低的原因,请一定在留言区分享,能帮助大家少掉一个坑是一个。
如果你成功躲开了上面5个坑,你的qPCR验证吻合率想不提高都难。
小编接下来说一个被大部分人忽略,但却是导致qPCR验证吻合率低的重要原因。这个原因来自测序实验过程,你猜出来了吗?
什么是Duplication?
在构建NGS测序文库时,通常要进行一定次数的PCR扩增,以满足测序所需的文库量。然而,由于扩增的偏好性以及扩增倍数的不确定性,导致各个片段被扩增的倍数是不一定相同的,这种因PCR扩增产生的重复reads即为Duplication[2]。
Duplication会对样本中基因表达定量造成干扰,特别是对中低表达丰度的基因影响更大。以下图为例,我们来说说Duplication是怎样干扰定量分析的。
假设样本中有三个mRNA片段,拷贝数分别为1,2,3,进行常规转录组建库,反转录后进行PCR扩增,扩增(存在偏好性)后产物拷贝数变成了3,7,5。此时测序定量结果已经偏离了样本中的原始拷贝数,因此使用带有Duplication的数据进行样本组间的基因差异表达分析,将不能准确反映出真实的差异。这是造成qPCR验证不出来的“被忽略的”上游重要原因。
图2 Duplication干扰基因定量
那么直接去除所有的重复reads,留下完全不重复的reads不就可以了吗?这样做太武断了。因为转录本天然就存在着多拷贝(如上面的例子),打断的片段自然也存在多拷贝,直接去除Duplication,会将真实的重复也一起去除了,也将无法得到样本组间真实的基因表达差异,而且会造成有效测序数据量的减少。所以不能简单地用生信的方法去除Duplication。
那就不去除Duplication了吗?想要获得更准确的定量结果,当然要做去除,但要讲究方式方法。能不能在转录组测序建库过程中就将真重复和假重复区分开来?
办法还真有,而且在一些特殊的测序项目中已经成功应用。
别急!我们下期接着说。
[1]A comprehensive assessment of RNA-seq accuracy, reproducibility and information content by the Sequencing Quality Control consortium. Nature Biotechnology, 2014.
[2]Aird D, Ross M G, Chen W S, et al. Analyzing and minimizing PCR amplification bias in Illumina sequencing libraries[J]. Genome Biology, 2011, 12(2):1-14.